home *** CD-ROM | disk | FTP | other *** search
/ Chip 2007 January, February, March & April / Chip-Cover-CD-2007-02.iso / Pakiet bezpieczenstwa / mini Pentoo LiveCD 2006.1 / mpentoo-2006.1.iso / livecd.squashfs / usr / lib / python2.4 / test / test_ucn.pyo (.txt) < prev    next >
Python Compiled Bytecode  |  2005-10-18  |  5KB  |  133 lines

  1. # Source Generated with Decompyle++
  2. # File: in.pyo (Python 2.4)
  3.  
  4. ''' Test script for the Unicode implementation.
  5.  
  6. Written by Bill Tutt.
  7. Modified for Python 2.0 by Fredrik Lundh (fredrik@pythonware.com)
  8.  
  9. (c) Copyright CNRI, All Rights Reserved. NO WARRANTY.
  10.  
  11. '''
  12. import unittest
  13. from test import test_support
  14.  
  15. class UnicodeNamesTest(unittest.TestCase):
  16.     
  17.     def checkletter(self, name, code):
  18.         res = eval(u'u"\\N{%s}"' % name)
  19.         self.assertEqual(res, code)
  20.         return res
  21.  
  22.     
  23.     def test_general(self):
  24.         chars = [
  25.             'LATIN CAPITAL LETTER T',
  26.             'LATIN SMALL LETTER H',
  27.             'LATIN SMALL LETTER E',
  28.             'SPACE',
  29.             'LATIN SMALL LETTER R',
  30.             'LATIN CAPITAL LETTER E',
  31.             'LATIN SMALL LETTER D',
  32.             'SPACE',
  33.             'LATIN SMALL LETTER f',
  34.             'LATIN CAPITAL LeTtEr o',
  35.             'LATIN SMaLl LETTER x',
  36.             'SPACE',
  37.             'LATIN SMALL LETTER A',
  38.             'LATIN SMALL LETTER T',
  39.             'LATIN SMALL LETTER E',
  40.             'SPACE',
  41.             'LATIN SMALL LETTER T',
  42.             'LATIN SMALL LETTER H',
  43.             'LATIN SMALL LETTER E',
  44.             'SpAcE',
  45.             'LATIN SMALL LETTER S',
  46.             'LATIN SMALL LETTER H',
  47.             'LATIN small LETTER e',
  48.             'LATIN small LETTER e',
  49.             'LATIN SMALL LETTER P',
  50.             'FULL STOP']
  51.         string = u'The rEd fOx ate the sheep.'
  52.         []([]([ self.checkletter(*args) for args in zip(chars, string) ]), string)
  53.  
  54.     
  55.     def test_ascii_letters(self):
  56.         import unicodedata as unicodedata
  57.         for char in ''.join(map(chr, xrange(ord('a'), ord('z')))):
  58.             name = 'LATIN SMALL LETTER %s' % char.upper()
  59.             code = unicodedata.lookup(name)
  60.             self.assertEqual(unicodedata.name(code), name)
  61.         
  62.  
  63.     
  64.     def test_hangul_syllables(self):
  65.         self.checkletter('HANGUL SYLLABLE GA', u'\xea\xb0\x80')
  66.         self.checkletter('HANGUL SYLLABLE GGWEOSS', u'\xea\xbf\xa8')
  67.         self.checkletter('HANGUL SYLLABLE DOLS', u'\xeb\x8f\x90')
  68.         self.checkletter('HANGUL SYLLABLE RYAN', u'\xeb\x9e\xb8')
  69.         self.checkletter('HANGUL SYLLABLE MWIK', u'\xeb\xae\xa0')
  70.         self.checkletter('HANGUL SYLLABLE BBWAEM', u'\xeb\xbe\x88')
  71.         self.checkletter('HANGUL SYLLABLE SSEOL', u'\xec\x8d\xb0')
  72.         self.checkletter('HANGUL SYLLABLE YI', u'\xec\x9d\x98')
  73.         self.checkletter('HANGUL SYLLABLE JJYOSS', u'\xec\xad\x80')
  74.         self.checkletter('HANGUL SYLLABLE KYEOLS', u'\xec\xbc\xa8')
  75.         self.checkletter('HANGUL SYLLABLE PAN', u'\xed\x8c\x90')
  76.         self.checkletter('HANGUL SYLLABLE HWEOK', u'\xed\x9b\xb8')
  77.         self.checkletter('HANGUL SYLLABLE HIH', u'\xed\x9e\xa3')
  78.         import unicodedata
  79.         self.assertRaises(ValueError, unicodedata.name, u'\xed\x9e\xa4')
  80.  
  81.     
  82.     def test_cjk_unified_ideographs(self):
  83.         self.checkletter('CJK UNIFIED IDEOGRAPH-3400', u'\xe3\x90\x80')
  84.         self.checkletter('CJK UNIFIED IDEOGRAPH-4DB5', u'\xe4\xb6\xb5')
  85.         self.checkletter('CJK UNIFIED IDEOGRAPH-4E00', u'\xe4\xb8\x80')
  86.         self.checkletter('CJK UNIFIED IDEOGRAPH-9FA5', u'\xe9\xbe\xa5')
  87.         self.checkletter('CJK UNIFIED IDEOGRAPH-20000', u'\xf0\xa0\x80\x80')
  88.         self.checkletter('CJK UNIFIED IDEOGRAPH-2A6D6', u'\xf0\xaa\x9b\x96')
  89.  
  90.     
  91.     def test_bmp_characters(self):
  92.         import unicodedata
  93.         count = 0
  94.         for code in xrange(65536):
  95.             char = unichr(code)
  96.             name = unicodedata.name(char, None)
  97.             if name is not None:
  98.                 self.assertEqual(unicodedata.lookup(name), char)
  99.                 count += 1
  100.                 continue
  101.         
  102.  
  103.     
  104.     def test_misc_symbols(self):
  105.         self.checkletter('PILCROW SIGN', u'\xc2\xb6')
  106.         self.checkletter('REPLACEMENT CHARACTER', u'\xef\xbf\xbd')
  107.         self.checkletter('HALFWIDTH KATAKANA SEMI-VOICED SOUND MARK', u'\xef\xbe\x9f')
  108.         self.checkletter('FULLWIDTH LATIN SMALL LETTER A', u'\xef\xbd\x81')
  109.  
  110.     
  111.     def test_errors(self):
  112.         import unicodedata
  113.         self.assertRaises(TypeError, unicodedata.name)
  114.         self.assertRaises(TypeError, unicodedata.name, u'xx')
  115.         self.assertRaises(TypeError, unicodedata.lookup)
  116.         self.assertRaises(KeyError, unicodedata.lookup, u'unknown')
  117.  
  118.     
  119.     def test_strict_eror_handling(self):
  120.         self.assertRaises(UnicodeError, unicode, '\\N{blah}', 'unicode-escape', 'strict')
  121.         self.assertRaises(UnicodeError, unicode, '\\N{%s}' % 'x' * 100000, 'unicode-escape', 'strict')
  122.         self.assertRaises(UnicodeError, unicode, '\\N{SPACE', 'unicode-escape', 'strict')
  123.         self.assertRaises(UnicodeError, unicode, '\\NSPACE', 'unicode-escape', 'strict')
  124.  
  125.  
  126.  
  127. def test_main():
  128.     test_support.run_unittest(UnicodeNamesTest)
  129.  
  130. if __name__ == '__main__':
  131.     test_main()
  132.  
  133.